医学图像分割的深度学习模型可能会出乎意料地且出乎意料地失败,而与训练图像相比,在不同中心获得的病理案例和图像,标签错误违反了专家知识。此类错误破坏了对医学图像细分的深度学习模型的可信赖性。检测和纠正此类故障的机制对于将该技术安全地转化为诊所至关重要,并且可能是对未来人工智能法规(AI)的要求。在这项工作中,我们提出了一个值得信赖的AI理论框架和一个实用系统,该系统可以使用后备方法和基于Dempster-Shafer理论的失败机制增强任何骨干AI系统。我们的方法依赖于可信赖的AI的可行定义。我们的方法会自动放弃由骨干AI预测的体素级标签,该标签违反了专家知识,并依赖于这些体素的后备。我们证明了拟议的值得信赖的AI方法在最大的报告的胎儿MRI的注释数据集中,由13个中心的540个手动注释的胎儿脑3D T2W MRI组成。我们值得信赖的AI方法改善了在各个中心获得的胎儿脑MRI和各种脑异常的胎儿的最先进的主链AI的鲁棒性。
translated by 谷歌翻译
限制机器学习系统的故障对于安全至关重要的应用至关重要。为了提高机器学习系统的鲁棒性,已提出了分配鲁棒优化(DRO)作为经验风险最小化(ERM)的概括。然而,由于与ERM的随机梯度下降(SGD)优化器相比,由于可用于DRO的优化器的相对效率相对效率相对低效率,因此在深度学习中的使用受到了严格的限制。我们建议使用硬度加权采样的SGD,这是机器学习中DRO的原则性高效优化方法,在深度学习的背景下特别适合。与实践中的硬示例挖掘策略类似,所提出的算法可以直接实施和计算,并且与用于深度学习的基于SGD的优化器一样有效,需要最小的开销计算。与典型的临时硬采矿方法相反,我们证明了我们的DRO算法的收敛性,用于过度参数化的深度学习网络,并具有RELU激活以及有限数量的层和参数。我们对MRI中胎儿脑3D MRI分割和脑肿瘤分割的实验证明了我们方法的可行性和有用性。使用我们的硬度加权采样进行训练,最先进的深度学习管道可改善自动胎儿脑中解剖学变异的鲁棒性3D MRI分割,并改善了对脑肿瘤分割的图像方案变化的鲁棒性。我们的代码可从https://github.com/lucasfidon/hardnessweightedsampler获得。
translated by 谷歌翻译
自然语言推论(NLI)是自然语言处理中的热门话题研究,句子之间的矛盾检测是NLI的特殊情况。这被认为是一项困难的NLP任务,当在许多NLP应用程序中添加为组件时,其影响很大,例如问答系统,文本摘要。阿拉伯语是由于其丰富的词汇,语义歧义而检测矛盾的最具挑战性的低资源语言之一。我们创建了一个超过12K句子的数据集并命名为Arnli,这将是公开可用的。此外,我们采用了一种新的模型,该模型受到斯坦福大学矛盾检测的启发,提出了有关英语的解决方案。我们提出了一种方法,以使用矛盾向量与语言模型向量作为机器学习模型的输入来检测阿拉伯语对句子之间的矛盾。我们分析了不同传统的机器学习分类器的结果,并比较了他们在创建的数据集(Arnli)和Pheme,病态的英语数据集的自动翻译上进行了比较。使用随机森林分类器,精度为99%,60%和75%的Pheme,Sick和Arnli的最佳结果。
translated by 谷歌翻译
以安全为导向的研究思想和应用的开发需要精细的车辆轨迹数据,这些数据不仅具有很高的精度,而且还捕获了大量关键安全事件。本文介绍了Citysim数据集,该数据集的设计核心目的是促进基于安全的研究和应用。 Citysim的车辆轨迹从在12个不同位置录制的1140分钟的无人机视频中提取。它涵盖了各种道路几何形状,包括高速公路基本段,编织段,高速公路合并/偏离段,信号交叉点,停止对照的交叉点以及没有符号/信号控制的交叉点。通过五步操作生成CitySim轨迹,以确保轨迹精度。此外,数据集提供了车辆旋转的边界框信息,该信息被证明可以改善安全评估。与其他基于视频的轨迹数据集相比,CitySim数据集的严重性更高,包括切入,合并和分歧事件,其严重性更高。此外,CitySim通过提供相关资产(如记录位置的3D基本地图和信号时间)来促进对数字双胞胎应用的研究。这些功能为安全研究和应用程序提供了更全面的条件,例如自动驾驶汽车安全和基于位置的安全分析。该数据集可在https://github.com/ozheng1993/ucf-sst-citysim-dataset上在线获得。
translated by 谷歌翻译
在这项工作中,我们研究了新的算法生长过程。特别是,我们提出了三个增长操作,全倍加倍,加倍和加倍,并探索其在几何环境下所得过程的算法和结构特性。在建模方面,我们的系统在二维网格上运行,并以离散的时间段运行。该过程以初始形状$ s_i = s_0 $开头,并且在每个时间段$ t \ geq 1 $中,通过(并行)或多个特定类型的一个或多个增长操作应用于当前的形状 - 固定$ s_ { t-1} $,生成下一个实例$ s_t $,总是满足$ | s_t | > | s_ {t-1} | $。我们的目标是表征可以在$ o(\ log n)$或polygog $ n $ time steps中构建的形状类别,并确定最终形状$ s_f $是否可以从初始形状$ s_i $使用给定类型的增长操作的有限顺序,称为$ s_f $的构造函数。对于完整的加倍,在每个时间阶段,每个节点都会在给定方向上生成一个新节点,我们完全表征可以从给定初始形状构造的形状类别的结构。对于RC加倍,在其中完整的列或行加倍,我们的主要贡献是线性时间集中算法,对于任何一对形状$ s_i $,$ s_f $决定是否可以从$ s_i $构建$ s_f $,以及,如果答案是肯定的,从$ s_i $返回$ o(\ log n)$ - $ s_f $的时间步构造函数。对于最一般的加倍操作,在单个节点可以翻倍的情况下,我们表明某些形状不能以次线性时间步长构建,并从单s_i $ s_i $中提供两个$ s_f $的通用构造函数,这是有效的(即,到各种形状的阶段时间阶段)。两个构造函数都可以通过多项式时间集中算法计算出任何形状$ s_f $。
translated by 谷歌翻译
Scheduled batch jobs have been widely used on the asynchronous computing platforms to execute various enterprise applications, including the scheduled notifications and the candidate pre-computation for the modern recommender systems. It is important to deliver or update the information to the users at the right time to maintain the user experience and the execution impact. However, it is challenging to provide a versatile execution time optimization solution for the user-basis scheduled jobs to satisfy various product scenarios while maintaining reasonable infrastructure resource consumption. In this paper, we describe how we apply a learning-to-rank approach plus a "best time policy" in the best time selection. In addition, we propose an ensemble learner to minimize the ranking loss by efficiently leveraging multiple streams of user activity signals in our scheduling decisions of the execution time. Especially, we observe the cannibalization cross use cases to compete the user's peak time slot and introduce a coordination system to mitigate the problem. Our optimization approach has been successfully tested with production traffic that serves billions of users per day, with statistically significant improvements in various product metrics, including the notifications and content candidate generation. To the best of our knowledge, our study represents the first ML-based multi-tenant solution of the execution time optimization problem for the scheduled jobs at a large industrial scale cross different product domains.
translated by 谷歌翻译
如今,可以在许多电子商务平台上找到自动建议,并且此类建议可以为消费者和提供商创造巨大的价值。但是,通常并非所有推荐的物品都具有相同的利润率,因此,提供商可能会诱使促进最大化其利润的项目。在短期内,消费者可能会接受非最佳建议,但从长远来看,他们可能会失去信任。最终,这导致了设计平衡推荐策略的问题,这些策略既考虑消费者和提供商的价值,并带来持续的业务成功。这项工作提出了一个基于基于代理的建模的仿真框架,旨在帮助提供者探索不同推荐策略的纵向动态。在我们的模型中,消费者代理人收到了提供者的建议,并且建议的质量随着时间的推移影响消费者的信任。我们设计了几种推荐策略,可以使提供商的利润更大,或者对消费者公用事业。我们的模拟表明,一种混合​​策略会增加消费者公用事业的权重,但没有忽略盈利能力,从长远来看会导致累计利润最高。与纯粹的消费者或面向利润的策略相比,这种混合策略的利润增加了约20%。我们还发现,社交媒体可以加强观察到的现象。如果消费者严重依赖社交媒体,最佳战略的累积利润进一步增加。为了确保可重复性并培养未来的研究,我们将公开共享我们的灵活模拟框架。
translated by 谷歌翻译
标准化流量是一类深生成模型,比传统的蒙特卡洛模拟更有效地为晶格场理论提供了有希望的途径。在这项工作中,我们表明,随机归一化流的理论框架,其中神经网络层与蒙特卡洛更新结合在一起,与基于jarzynski平等的不平衡模拟的基础相同,这些模拟最近已被部署以计算计算晶格计理论的自由能差异。我们制定了一种策略,以优化这种扩展类别的生成模型的效率和应用程序的示例。
translated by 谷歌翻译
越来越多的语义资源提供了人类知识的宝贵储存;但是,错误条目的概率随着尺寸的增加而增加。因此,识别给定知识库的潜在虚假部分的方法正在成为越来越重要的感兴趣领域。在这项工作中,我们展示了对仅结构的链接分析方法的系统评估是否可以提供可扩展手段,以检测可能的异常,以及潜在的有趣的新颖关系候选者。在八种不同的语义资源中评估十三方法,包括基因本体,食品本体,海洋本体论和类似,我们证明了仅限结构的链接分析可以为数据集的子集提供可扩展的异常检测。此外,我们证明,通过考虑符号节点嵌入,可以获得预测(链接)的说明,使得该方法的该分支可能比黑盒更有价值。据我们所知,这是目前,来自不同域的语义资源的不同类型链路分析方法的适用性最广泛的系统研究之一。
translated by 谷歌翻译